编辑距离:衡量两个字符串之间差异程度的指标,通常指把一个字符串转换成另一个字符串所需的最少编辑操作次数。常见操作包括插入、删除、替换(最典型的是 Levenshtein distance)。在拼写纠错、模糊搜索、生物信息学序列比对等场景很常用。
/ˈɛdɪt ˈdɪstəns/
The edit distance between “cat” and “cut” is 1.
“cat”和“cut”的编辑距离是1。
To improve search suggestions, the system ranks candidate words by edit distance and other signals such as word frequency.
为了改进搜索建议,系统会按编辑距离以及词频等其他信号对候选词进行排序。
Edit 源自拉丁语 editus / edere(“发表、推出”相关含义),后来在现代语境中引申为“编辑、修改”;distance 来自拉丁语 distantia(“距离、间隔”)。合在一起的 edit distance 是计算机科学中的术语,字面意思就是“通过编辑修改产生的差距/距离”。